{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "id": "ad49c459",
   "metadata": {},
   "outputs": [],
   "source": [
    "import pandas as pd"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "outputs": [
    {
     "data": {
      "text/plain": "     Unnamed: 0 recruiter.recruiterTitle comp.compScale comp.compStage  \\\n0             0                       人力          1-49人            NaN   \n1             1                       人力          1-49人            NaN   \n2             2                     HRBP       100-499人             D轮   \n3             3                     高级经理       10000人以上           美股上市   \n4             4                   产品运营经理     1000-2000人            NaN   \n..          ...                      ...            ...            ...   \n395          35                  猎头顾问/助理       100-499人             D轮   \n396          36                     招聘经理       100-499人             D轮   \n397          37                     招聘经理       100-499人             D轮   \n398          38                     招聘经理       100-499人             D轮   \n399          39                       HR       100-499人          融资未公开   \n\n    comp.compIndustry   comp.compName  \\\n0               非营利组织        中关村标准化协会   \n1               非营利组织        中关村标准化协会   \n2             航空/航天设备     北京中航智科技有限公司   \n3                 互联网           Baidu   \n4               计算机软件  北京智慧星光信息技术有限公司   \n..                ...             ...   \n395             互联网医疗           好大夫在线   \n396             互联网医疗           好大夫在线   \n397             互联网医疗           好大夫在线   \n398             互联网医疗           好大夫在线   \n399               互联网  北京医来伸手健康管理有限公司   \n\n                                            job.labels  job.dq  \\\n0                                        ['IT/互联网/软件']  北京-海淀区   \n1                                                   []  北京-海淀区   \n2                                               ['本科']      北京   \n3             ['人工智能', '产品运营', '活动运营', '线下运营', '线上运营']      北京   \n4                                   ['b端产品运营', '用户运营']      北京   \n..                                                 ...     ...   \n395                                  ['医疗健康', '互联网医疗']  北京-朝阳区   \n396  ['分诊', '核医学科', '医疗健康', '健康指导', '术后病人', '互联网医疗'...  北京-朝阳区   \n397                                                 []  北京-朝阳区   \n398                                                 []  北京-朝阳区   \n399                                           ['视频剪辑']  北京-昌平区   \n\n    job.campusJobKind                    job.title  job.salary  \n0                 NaN                         项目助理       5-10k  \n1                 NaN                        项目管培生        薪资面议  \n2                  应届                        销售工程师  13-16k·14薪  \n3                 NaN                 产品运营-营销和生态方向      20-40k  \n4                 NaN                      产品运营实习生        2-5k  \n..                ...                          ...         ...  \n395               NaN  好大夫-互联网医疗运营（限临床/预防/护理等医学专业）  10-18k·16薪  \n396               NaN       健康顾问（15-20K，16薪）J10974  15-20k·16薪  \n397               NaN     医学专员（底薪15-20K，16薪）J10974  15-20k·16薪  \n398               NaN       运营专员（10-20K，16薪）J10974  11-20k·16薪  \n399               NaN                         视频剪辑       6-11k  \n\n[400 rows x 11 columns]",
      "text/html": "<div>\n<style scoped>\n    .dataframe tbody tr th:only-of-type {\n        vertical-align: middle;\n    }\n\n    .dataframe tbody tr th {\n        vertical-align: top;\n    }\n\n    .dataframe thead th {\n        text-align: right;\n    }\n</style>\n<table border=\"1\" class=\"dataframe\">\n  <thead>\n    <tr style=\"text-align: right;\">\n      <th></th>\n      <th>Unnamed: 0</th>\n      <th>recruiter.recruiterTitle</th>\n      <th>comp.compScale</th>\n      <th>comp.compStage</th>\n      <th>comp.compIndustry</th>\n      <th>comp.compName</th>\n      <th>job.labels</th>\n      <th>job.dq</th>\n      <th>job.campusJobKind</th>\n      <th>job.title</th>\n      <th>job.salary</th>\n    </tr>\n  </thead>\n  <tbody>\n    <tr>\n      <th>0</th>\n      <td>0</td>\n      <td>人力</td>\n      <td>1-49人</td>\n      <td>NaN</td>\n      <td>非营利组织</td>\n      <td>中关村标准化协会</td>\n      <td>['IT/互联网/软件']</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>项目助理</td>\n      <td>5-10k</td>\n    </tr>\n    <tr>\n      <th>1</th>\n      <td>1</td>\n      <td>人力</td>\n      <td>1-49人</td>\n      <td>NaN</td>\n      <td>非营利组织</td>\n      <td>中关村标准化协会</td>\n      <td>[]</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>项目管培生</td>\n      <td>薪资面议</td>\n    </tr>\n    <tr>\n      <th>2</th>\n      <td>2</td>\n      <td>HRBP</td>\n      <td>100-499人</td>\n      <td>D轮</td>\n      <td>航空/航天设备</td>\n      <td>北京中航智科技有限公司</td>\n      <td>['本科']</td>\n      <td>北京</td>\n      <td>应届</td>\n      <td>销售工程师</td>\n      <td>13-16k·14薪</td>\n    </tr>\n    <tr>\n      <th>3</th>\n      <td>3</td>\n      <td>高级经理</td>\n      <td>10000人以上</td>\n      <td>美股上市</td>\n      <td>互联网</td>\n      <td>Baidu</td>\n      <td>['人工智能', '产品运营', '活动运营', '线下运营', '线上运营']</td>\n      <td>北京</td>\n      <td>NaN</td>\n      <td>产品运营-营销和生态方向</td>\n      <td>20-40k</td>\n    </tr>\n    <tr>\n      <th>4</th>\n      <td>4</td>\n      <td>产品运营经理</td>\n      <td>1000-2000人</td>\n      <td>NaN</td>\n      <td>计算机软件</td>\n      <td>北京智慧星光信息技术有限公司</td>\n      <td>['b端产品运营', '用户运营']</td>\n      <td>北京</td>\n      <td>NaN</td>\n      <td>产品运营实习生</td>\n      <td>2-5k</td>\n    </tr>\n    <tr>\n      <th>...</th>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n    </tr>\n    <tr>\n      <th>395</th>\n      <td>35</td>\n      <td>猎头顾问/助理</td>\n      <td>100-499人</td>\n      <td>D轮</td>\n      <td>互联网医疗</td>\n      <td>好大夫在线</td>\n      <td>['医疗健康', '互联网医疗']</td>\n      <td>北京-朝阳区</td>\n      <td>NaN</td>\n      <td>好大夫-互联网医疗运营（限临床/预防/护理等医学专业）</td>\n      <td>10-18k·16薪</td>\n    </tr>\n    <tr>\n      <th>396</th>\n      <td>36</td>\n      <td>招聘经理</td>\n      <td>100-499人</td>\n      <td>D轮</td>\n      <td>互联网医疗</td>\n      <td>好大夫在线</td>\n      <td>['分诊', '核医学科', '医疗健康', '健康指导', '术后病人', '互联网医疗'...</td>\n      <td>北京-朝阳区</td>\n      <td>NaN</td>\n      <td>健康顾问（15-20K，16薪）J10974</td>\n      <td>15-20k·16薪</td>\n    </tr>\n    <tr>\n      <th>397</th>\n      <td>37</td>\n      <td>招聘经理</td>\n      <td>100-499人</td>\n      <td>D轮</td>\n      <td>互联网医疗</td>\n      <td>好大夫在线</td>\n      <td>[]</td>\n      <td>北京-朝阳区</td>\n      <td>NaN</td>\n      <td>医学专员（底薪15-20K，16薪）J10974</td>\n      <td>15-20k·16薪</td>\n    </tr>\n    <tr>\n      <th>398</th>\n      <td>38</td>\n      <td>招聘经理</td>\n      <td>100-499人</td>\n      <td>D轮</td>\n      <td>互联网医疗</td>\n      <td>好大夫在线</td>\n      <td>[]</td>\n      <td>北京-朝阳区</td>\n      <td>NaN</td>\n      <td>运营专员（10-20K，16薪）J10974</td>\n      <td>11-20k·16薪</td>\n    </tr>\n    <tr>\n      <th>399</th>\n      <td>39</td>\n      <td>HR</td>\n      <td>100-499人</td>\n      <td>融资未公开</td>\n      <td>互联网</td>\n      <td>北京医来伸手健康管理有限公司</td>\n      <td>['视频剪辑']</td>\n      <td>北京-昌平区</td>\n      <td>NaN</td>\n      <td>视频剪辑</td>\n      <td>6-11k</td>\n    </tr>\n  </tbody>\n</table>\n<p>400 rows × 11 columns</p>\n</div>"
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df = pd.read_excel('北京_产品运营_应届生.xlsx')\n",
    "df"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "markdown",
   "source": [
    "# 1.comp.compIndustry 行业分析（Demo:单一分类数据词频分析）"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "outputs": [
    {
     "data": {
      "text/plain": "0            中关村标准化协会\n1            中关村标准化协会\n2         北京中航智科技有限公司\n3               Baidu\n4      北京智慧星光信息技术有限公司\n            ...      \n395             好大夫在线\n396             好大夫在线\n397             好大夫在线\n398             好大夫在线\n399    北京医来伸手健康管理有限公司\nName: comp.compName, Length: 400, dtype: object"
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df['comp.compName']"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "outputs": [
    {
     "data": {
      "text/plain": "comp.compName\n北京厚朴优学教育科技有限公司    28\n光谷动力科技            14\nBaidu              8\n京东                 7\n字节跳动               5\n                  ..\n深圳乐巢时代科技有限公司       1\n北京链鲸科技有限公司         1\n新氧科技               1\n北京乐城堡科技有限公司        1\n北京医来伸手健康管理有限公司     1\nName: count, Length: 296, dtype: int64"
     },
     "execution_count": 5,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df['comp.compName'].value_counts()"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "outputs": [
    {
     "data": {
      "text/plain": "[('北京厚朴优学教育科技有限公司', 28),\n ('光谷动力科技', 14),\n ('Baidu', 8),\n ('京东', 7),\n ('字节跳动', 5),\n ('好大夫在线', 4),\n ('京东商城', 4),\n ('北京和平阳光国际健身俱乐部有限公司', 4),\n ('北京世纪好未来教育科技有限公司', 3),\n ('北京抖音信息服务有限公司', 3),\n ('美团网', 3),\n ('百度(中国)有限公司', 3),\n ('曼迪匹艾(北京)科技服务有限公司', 3),\n ('北京智慧星光信息技术有限公司', 3),\n ('北京中航智科技有限公司', 2),\n ('用友网络科技股份有限公司', 2),\n ('华为', 2),\n ('北京宏昆酒店集团', 2),\n ('酷渲(北京)科技有限公司', 2),\n ('北京金巴顺漾科技有限公司', 2),\n ('北京网安通达科技有限公司', 2),\n ('北京胜尊信息技术有限公司', 2),\n ('北京同仁堂健康', 2),\n ('一寸光年', 2),\n ('中关村标准化协会', 2),\n ('烟台莹佳食品有限公司', 2),\n ('北京崇珍科贸有限公司', 2),\n ('软通动力', 2),\n ('泰康健投', 2),\n ('联东集团', 2),\n ('百度网讯', 2),\n ('北京炎龙时空通信科技有限责任公司', 2),\n ('戍源优品科技发展(北京)有限公司', 2),\n ('颐康润养(北京)科技发展有限公司', 2),\n ('北京华清易点科技有限公司', 2),\n ('北京嘀果技术服务有限公司', 2),\n ('沃丰科技', 2),\n ('北京国质联合检测技术研究院', 2),\n ('链家地产', 2),\n ('北京格瑞广告传媒有限公司', 2),\n ('恒昌', 1),\n ('惠买在线', 1),\n ('北京质云数据科技有限公司', 1),\n ('须眉智能科技(江苏)有限公司', 1),\n ('北京世纪高教图书有限公司', 1),\n ('北京医来伸手健康管理有限公司同世堂中医诊所', 1),\n ('北京小牛邦信息技术有限公司', 1),\n ('北京鹰瞳科技发展股份有限公司', 1),\n ('顺丰速运', 1),\n ('北京宠医点评科技有限公司', 1),\n ('北京华创盈讯科技有限公司', 1),\n ('北京京邦达贸易有限公司', 1),\n ('永福盛(北京)食品有限公司', 1),\n ('北京天一沃德商务服务有限公司', 1),\n ('日推石化(北京)有限公司', 1),\n ('北京东方明悦体育发展有限公司', 1),\n ('北京宏途创联科技有限公司', 1),\n ('北京聚英星辉科技有限公司', 1),\n ('北京微联至元商贸有限公司', 1),\n ('北京航天创智科技有限公司', 1),\n ('北京顺昌盛世医疗大数据科技有限公司同世堂第零零零中医诊所', 1),\n ('启鸣梧桐(北京)科技有限公司', 1),\n ('北京网讯达科技有限公司', 1),\n ('北京众心天诚科技发展有限公司', 1),\n ('北京积木控文化有限公司', 1),\n ('呷哺呷哺', 1),\n ('北京润泽慧教育科技有限公司', 1),\n ('百度时代网络', 1),\n ('北京紫光数智科技股份有限公司', 1),\n ('中信科智联科技有限公司', 1),\n ('东风汽车金融有限公司', 1),\n ('美世留学', 1),\n ('北京易点淘网络技术有限公司', 1),\n ('北京书香文雅图书文化有限公司', 1),\n ('上海睿沃信息科技有限公司', 1),\n ('云南白药集团股份有限公司', 1),\n ('中国电信安全公司', 1),\n ('HORWATH酒店管理顾问(北京)有限公司', 1),\n ('华为云计算技术有限公司', 1),\n ('北京信联数安科技有限公司', 1),\n ('修正药业集团股份有限公司', 1),\n ('北京京西重工有限公司', 1),\n ('欣可丽美学(上海)医疗科技有限公司', 1),\n ('骏安供应链科技有限公司', 1),\n ('英雄互娱科技股份有限公司', 1),\n ('宝马(中国)汽车贸易有限公司', 1),\n ('北京清能互联科技有限公司', 1),\n ('北京云动九天科技有限公司', 1),\n ('三节课', 1),\n ('中信期货', 1),\n ('数坤科技', 1),\n ('小川科技', 1),\n ('蒙羊康盛(北京)食品有限公司', 1),\n ('北京瑞通领航科技有限公司', 1),\n ('北京爱车团网络科技有限公司', 1),\n ('Yogo Robot', 1),\n ('宜佰壹(北京)餐饮管理有限公司', 1),\n ('北京开金睿远管理咨询有限公司', 1),\n ('北京伴刻翼科技有限公司', 1),\n ('高途', 1),\n ('航天开元', 1),\n ('咏怀钟鼎', 1),\n ('德科信息', 1),\n ('泰康在线财产保险股份有限公司', 1),\n ('北京钓台傲骄食品科技有限公司', 1),\n ('中国信息通信研究院', 1),\n ('百融云创', 1),\n ('清源泰硕', 1),\n ('北京企悦惠科技发展有限公司', 1),\n ('山东九鑫生物工程有限公司', 1),\n ('长信恒业家族办公室', 1),\n ('安徽省永幕教育咨询有限公司', 1),\n ('北京草莓时代文化传媒有限责任公司', 1),\n ('北京朗迪锋科技有限公司', 1),\n ('去哪儿', 1),\n ('利玛软件', 1),\n ('都美(北京)品牌管理有限公司', 1),\n ('北京一景园林有限公司', 1),\n ('北京祉君商贸有限公司', 1),\n ('北京锐服信科技有限公司', 1),\n ('上海尝享网络科技有限公司', 1),\n ('镭神智能', 1),\n ('北京双子博鑫文化传播有限公司', 1),\n ('北京中润广益科技发展有限公司', 1),\n ('北京博思汇文数字科技有限公司', 1),\n ('北京德达互动咨询有限公司', 1),\n ('北京一来电子商务有限公司', 1),\n ('北京红豆树网络科技有限公司', 1),\n ('北京学力星球科技有限责任公司', 1),\n ('北京睿美傲世文化传播有限公司', 1),\n ('北京简舍装饰设计有限公司', 1),\n ('北京泽元堂', 1),\n ('方正中期期货', 1),\n ('北京法利莱移动板房有限公司', 1),\n ('云南澜博科技有限公司', 1),\n ('北京万相归春网络科技有限公司', 1),\n ('睿艺视通信息技术(北京)有限公司', 1),\n ('金桐网', 1),\n ('汇才远达(北京)科技有限公司', 1),\n ('云豆传媒(北京)有限公司', 1),\n ('北京飞步凌云科技有限公司', 1),\n ('北京知牧科技有限责任公司', 1),\n ('北京创金启富', 1),\n ('北京中科九章软件有限公司', 1),\n ('平安健康保险股份有限公司北京分公司', 1),\n ('小米', 1),\n ('中讯邮电咨询设计院有限公司', 1),\n ('朗姿股份有限公司', 1),\n ('是通科技(北京)有限公司', 1),\n ('Transfer easy', 1),\n ('金诚信', 1),\n ('中国电信股份有限公司', 1),\n ('上海南燕信息技术有限公司', 1),\n ('远海国际旅游集团', 1),\n ('北京新锐伟业网络技术有限公司', 1),\n ('爱康网', 1),\n ('北京玮航科技有限公司', 1),\n ('泰康健康管理(北京)有限公司', 1),\n ('思梵私募基金管理(杭州)有限公司', 1),\n ('视源股份', 1),\n ('北京人人平安科技有限公司', 1),\n ('北京骏嘉财通科技有限公司', 1),\n ('北京龙宏兴塑日用品有限公司', 1),\n ('京东集团', 1),\n ('中国青年出版总社有限公司', 1),\n ('抖音视界有限公司', 1),\n ('集易行', 1),\n ('北京科学技术出版社', 1),\n ('北京牛客科技有限公司', 1),\n ('北京金风科创风电设备有限公司', 1),\n ('佛山市南海区中城数字城市促进中心', 1),\n ('完美世界', 1),\n ('海南鹭鹰私募基金管理合伙企业(有限合伙)', 1),\n ('苏州聊医聊信息科技有限公司', 1),\n ('北京蓝海在线科技有限公司', 1),\n ('京华观致(北京)国际信息咨询有限公司', 1),\n ('华农财产保险', 1),\n ('愿景和家', 1),\n ('北京千里马网信科技有限公司', 1),\n ('微博', 1),\n ('北京百灵威科技有限公司', 1),\n ('北京汇智捷科技有限公司', 1),\n ('阿尔特汽车技术股份有限公司', 1),\n ('我看网络技术(北京)有限公司', 1),\n ('中国民生银行股份有限公司', 1),\n ('搜狐', 1),\n ('国科恒泰(北京)医疗科技股份有限公司', 1),\n ('新东方前途', 1),\n ('巴别时代', 1),\n ('北京优品酷卖科技有限公司', 1),\n ('北京形上科技有限责任公司', 1),\n ('北京格力森酒业有限公司', 1),\n ('分享通信', 1),\n ('凤凰网', 1),\n ('走遍世界(北京)信息技术有限公司', 1),\n ('北京青翼凌云科技有限公司', 1),\n ('北京课厅教育科技有限公司', 1),\n ('北京易思卓科技有限公司', 1),\n ('中国航空器拥有者及驾驶员协会', 1),\n ('北京城市网邻信息技术有限公司', 1),\n ('北京诚悦晟达商贸有限公司', 1),\n ('一心向上', 1),\n ('北京中欣银宝通支付服务有限公司', 1),\n ('中青旅控股股份有限公司', 1),\n ('贝壳找房(北京)科技有限公司', 1),\n ('半糖去冰科技(北京)有限公司', 1),\n ('北京航天智造科技发展有限公司', 1),\n ('中国农业电影电视中心', 1),\n ('一汽(北京)软件科技有限公司', 1),\n ('建信融通有限责任公司', 1),\n ('布比科技', 1),\n ('花香盛世国际体育', 1),\n ('深圳市商汤科技有限公司', 1),\n ('北京人教希望读者服务有限责任公司', 1),\n ('迦游', 1),\n ('金山办公软件', 1),\n ('北京金桐网科技有限公司', 1),\n ('北京顺丰同城科技有限公司', 1),\n ('景行慧动', 1),\n ('单赤道(北京)咖啡餐饮管理有限责任公司', 1),\n ('守望地球(北京)环境科技有限公司', 1),\n ('北京丰泽晟华农业科技发展有限公司', 1),\n ('17173', 1),\n ('超极想网络科技(北京)有限公司', 1),\n ('三星电子', 1),\n ('北京学策科技有限公司', 1),\n ('北京金玺文化传媒有限公司', 1),\n ('时代传浮', 1),\n ('网易有道', 1),\n ('北京独角鲸群文化创意有限公司', 1),\n ('北京叁姐妹网络科技有限公司', 1),\n ('北京合众衡平信息技术有限责任公司', 1),\n ('北京乘风扬航科技有限公司', 1),\n ('畅游天下', 1),\n ('北京海丰特环境科技发展有限公司', 1),\n ('北京掌上先机网络科技有限公司(慧策)', 1),\n ('明世公司', 1),\n ('阿里巴巴集团', 1),\n ('润泽环保', 1),\n ('北京章鱼小泡泡科技有限公司', 1),\n ('中科博爱(北京)咨询有限公司', 1),\n ('北京维应科技有限责任公司', 1),\n ('阳光保险集团', 1),\n ('北京君尚伟业科技有限公司', 1),\n ('独角鲨(北京)科技有限公司', 1),\n ('麦凯隆(北京)家居用品有限公司', 1),\n ('快手', 1),\n ('施耐德电气', 1),\n ('荣耀终端', 1),\n ('北京乐信圣文科技有限责任公司', 1),\n ('北京博雅甲睿文化发展有限公司', 1),\n ('北京金元尚杰科技有限公司', 1),\n ('华夏恒生', 1),\n ('北京鸿盈信息技术有限公司', 1),\n ('北京文迪威教育科技有限公司', 1),\n ('上海书品仓科技有限责任公司', 1),\n ('北京爱语吧科技有限公司', 1),\n ('金溪县阿里兄弟电子商务有限公司', 1),\n ('北京青峰玉吉科技咨询服务有限公司', 1),\n ('北京四维通联电讯器材有限公司', 1),\n ('梦灵国际医疗科技(北京)有限责任公司', 1),\n ('北京疯狂体育产业管理有限公司', 1),\n ('合生创展集团有限公司', 1),\n ('国信证券股份有限公司', 1),\n ('天津魔芝工坊信息技术有限公司', 1),\n ('新世纪医疗', 1),\n ('厦门安踏服饰有限公司', 1),\n ('北京蓝色光标数字传媒科技有限公司', 1),\n ('赋范空间', 1),\n ('水滴公司', 1),\n ('海鸿达(北京)餐饮管理有限公司', 1),\n ('博思致新', 1),\n ('医药魔方', 1),\n ('北京御生堂健康产业集团有限公司', 1),\n ('朗致集团', 1),\n ('北京市酥米教育科技有限公司', 1),\n ('中国人寿保险销售有限责任公司', 1),\n ('张家口花椒科技有限公司', 1),\n ('航天信息软件技术有限公司', 1),\n ('北京华熙海御科技有限公司', 1),\n ('灵岩创世', 1),\n ('北京天算资产管理有限公司', 1),\n ('山东辰扬环境科技有限公司', 1),\n ('网易集团', 1),\n ('北京北信源软件股份有限公司', 1),\n ('北京中程润达科技有限公司', 1),\n ('蚂蚁集团', 1),\n ('北京弘毅远科技有限公司', 1),\n ('京东方空间数智', 1),\n ('北京牧游科技有限公司', 1),\n ('浙江游侠客国际旅行社有限公司北京分公司', 1),\n ('深圳乐巢时代科技有限公司', 1),\n ('北京链鲸科技有限公司', 1),\n ('新氧科技', 1),\n ('北京乐城堡科技有限公司', 1),\n ('北京医来伸手健康管理有限公司', 1)]"
     },
     "execution_count": 10,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "word_compName = [(i,v) for i,v in df['comp.compName'].value_counts().items()]\n",
    "word_compName"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "markdown",
   "source": [],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 33,
   "outputs": [],
   "source": [
    "import json\n",
    "\n",
    "from pyecharts import options as opts\n",
    "from pyecharts.charts import WordCloud\n",
    "\n",
    "c=(\n",
    "    WordCloud()\n",
    "    .add(series_name=\"热点分析\", data_pair=word_compName, word_size_range=[6, 66])\n",
    "    .set_global_opts(\n",
    "        title_opts=opts.TitleOpts(\n",
    "            title=\"热点分析\", title_textstyle_opts=opts.TextStyleOpts(font_size=23)\n",
    "        ),\n",
    "        tooltip_opts=opts.TooltipOpts(is_show=True),\n",
    "    )\n",
    "    .render(\"basic_wordcloud.html\")\n",
    ")"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "markdown",
   "source": [
    "# 2.多层级的字段分析"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 16,
   "outputs": [
    {
     "data": {
      "text/plain": "Index(['Unnamed: 0', 'recruiter.recruiterTitle', 'comp.compScale',\n       'comp.compStage', 'comp.compIndustry', 'comp.compName', 'job.labels',\n       'job.dq', 'job.campusJobKind', 'job.title', 'job.salary'],\n      dtype='object')"
     },
     "execution_count": 16,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df.columns"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 18,
   "outputs": [
    {
     "data": {
      "text/plain": "     job.dq comp.compIndustry                    job.title\n0    北京-海淀区             非营利组织                         项目助理\n1    北京-海淀区             非营利组织                        项目管培生\n2        北京           航空/航天设备                        销售工程师\n3        北京               互联网                 产品运营-营销和生态方向\n4        北京             计算机软件                      产品运营实习生\n..      ...               ...                          ...\n395  北京-朝阳区             互联网医疗  好大夫-互联网医疗运营（限临床/预防/护理等医学专业）\n396  北京-朝阳区             互联网医疗       健康顾问（15-20K，16薪）J10974\n397  北京-朝阳区             互联网医疗     医学专员（底薪15-20K，16薪）J10974\n398  北京-朝阳区             互联网医疗       运营专员（10-20K，16薪）J10974\n399  北京-昌平区               互联网                         视频剪辑\n\n[400 rows x 3 columns]",
      "text/html": "<div>\n<style scoped>\n    .dataframe tbody tr th:only-of-type {\n        vertical-align: middle;\n    }\n\n    .dataframe tbody tr th {\n        vertical-align: top;\n    }\n\n    .dataframe thead th {\n        text-align: right;\n    }\n</style>\n<table border=\"1\" class=\"dataframe\">\n  <thead>\n    <tr style=\"text-align: right;\">\n      <th></th>\n      <th>job.dq</th>\n      <th>comp.compIndustry</th>\n      <th>job.title</th>\n    </tr>\n  </thead>\n  <tbody>\n    <tr>\n      <th>0</th>\n      <td>北京-海淀区</td>\n      <td>非营利组织</td>\n      <td>项目助理</td>\n    </tr>\n    <tr>\n      <th>1</th>\n      <td>北京-海淀区</td>\n      <td>非营利组织</td>\n      <td>项目管培生</td>\n    </tr>\n    <tr>\n      <th>2</th>\n      <td>北京</td>\n      <td>航空/航天设备</td>\n      <td>销售工程师</td>\n    </tr>\n    <tr>\n      <th>3</th>\n      <td>北京</td>\n      <td>互联网</td>\n      <td>产品运营-营销和生态方向</td>\n    </tr>\n    <tr>\n      <th>4</th>\n      <td>北京</td>\n      <td>计算机软件</td>\n      <td>产品运营实习生</td>\n    </tr>\n    <tr>\n      <th>...</th>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n    </tr>\n    <tr>\n      <th>395</th>\n      <td>北京-朝阳区</td>\n      <td>互联网医疗</td>\n      <td>好大夫-互联网医疗运营（限临床/预防/护理等医学专业）</td>\n    </tr>\n    <tr>\n      <th>396</th>\n      <td>北京-朝阳区</td>\n      <td>互联网医疗</td>\n      <td>健康顾问（15-20K，16薪）J10974</td>\n    </tr>\n    <tr>\n      <th>397</th>\n      <td>北京-朝阳区</td>\n      <td>互联网医疗</td>\n      <td>医学专员（底薪15-20K，16薪）J10974</td>\n    </tr>\n    <tr>\n      <th>398</th>\n      <td>北京-朝阳区</td>\n      <td>互联网医疗</td>\n      <td>运营专员（10-20K，16薪）J10974</td>\n    </tr>\n    <tr>\n      <th>399</th>\n      <td>北京-昌平区</td>\n      <td>互联网</td>\n      <td>视频剪辑</td>\n    </tr>\n  </tbody>\n</table>\n<p>400 rows × 3 columns</p>\n</div>"
     },
     "execution_count": 18,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df[['job.dq','comp.compIndustry','job.title']]"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 19,
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "北京\n",
      "北京-东城区\n",
      "北京-昌平区\n",
      "北京-丰台区\n",
      "北京-海淀区\n",
      "北京-大兴区\n",
      "北京-延庆区\n",
      "北京-通州区\n",
      "北京-怀柔区\n",
      "北京-朝阳区\n",
      "北京-石景山区\n",
      "北京-平谷区\n",
      "北京-门头沟区\n",
      "北京-顺义区\n",
      "北京-西城区\n",
      "北京-房山区\n"
     ]
    }
   ],
   "source": [
    "for i in set(df['job.dq']):\n",
    "    print(i)"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 25,
   "outputs": [
    {
     "data": {
      "text/plain": "{'IT服务',\n '专业技术服务',\n '互联网',\n '人工智能',\n '其他教育培训',\n '制药',\n '医疗器械',\n '咨询服务',\n '在线教育',\n '在线社交/媒体',\n '培训服务',\n '广播/影视/录音',\n '房地产租赁/中介',\n '批发/零售',\n '政府/公共事业',\n '新闻和出版业',\n '环保',\n '生活服务O2O',\n '电子商务',\n '科技推广服务',\n '科技金融',\n '航空/航天设备',\n '计算机硬件',\n '计算机软件',\n '货运/物流/仓储',\n '通信设备',\n '酒店/民宿',\n '非营利组织'}"
     },
     "execution_count": 25,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "北京海淀区产业集合 = set(df[df['job.dq'].isin(['北京-海淀区'])]['comp.compIndustry'])\n",
    "北京海淀区产业集合"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 27,
   "outputs": [
    {
     "data": {
      "text/plain": "     Unnamed: 0 recruiter.recruiterTitle comp.compScale comp.compStage  \\\n0             0                       人力          1-49人            NaN   \n1             1                       人力          1-49人            NaN   \n10           10                     HRBP       100-499人             A轮   \n11           11                     招聘经理       10000人以上           美股上市   \n15           15                     产品运营       10000人以上           美股上市   \n..          ...                      ...            ...            ...   \n373          13                    iOS开发       100-499人            NaN   \n374          14                     人资专员          1-49人            NaN   \n381          21               consultant    5000-10000人           美股上市   \n384          24                     HRBP       100-499人            NaN   \n386          26                      经理人          1-49人          融资未公开   \n\n    comp.compIndustry    comp.compName  \\\n0               非营利组织         中关村标准化协会   \n1               非营利组织         中关村标准化协会   \n10               科技金融             一心向上   \n11                互联网            Baidu   \n15               培训服务  北京世纪好未来教育科技有限公司   \n..                ...              ...   \n373            科技推广服务           光谷动力科技   \n374             计算机软件    北京企悦惠科技发展有限公司   \n381              电子商务              去哪儿   \n384            专业技术服务   都美(北京)品牌管理有限公司   \n386             批发/零售       北京祉君商贸有限公司   \n\n                                            job.labels  job.dq  \\\n0                                        ['IT/互联网/软件']  北京-海淀区   \n1                                                   []  北京-海淀区   \n10   ['数据运营', '产品运营', '工单管理', '互联网金融', '工具产品', 'to ...  北京-海淀区   \n11               ['产品运营', '社区运营', '策略运营', 'IT/互联网/软件']  北京-海淀区   \n15                                    ['产品运营', '数据分析']  北京-海淀区   \n..                                                 ...     ...   \n373                                          ['HTML5']  北京-海淀区   \n374  ['社群运营', '内容运营', '产品运营', '用户运营', '教育培训', '线上运营...  北京-海淀区   \n381   ['推荐产品', '策略产品', '智能推荐', '产品优化', '数据分析', '用户研究']  北京-海淀区   \n384           ['活动运营', '产品运营', '用户运营', '平台运营', '淘宝平台']  北京-海淀区   \n386                               ['电商类目运营', '母婴电商运营']  北京-海淀区   \n\n    job.campusJobKind              job.title  job.salary  \n0                 NaN                   项目助理       5-10k  \n1                 NaN                  项目管培生        薪资面议  \n10                NaN     产品运营经理——股权激励SaaS产品   8-10k·13薪  \n11                NaN       AIGC产品运营(J59073)  25-50k·16薪  \n15                NaN                产品运营实习生        3-5k  \n..                ...                    ...         ...  \n373               NaN                  HTML5  12-16k·13薪  \n374               NaN            内容运营实习生（幼教）        2-5k  \n381               NaN  搜索推荐策略产品经理 (MJ005771)  25-40k·16薪  \n384               NaN                 电商运营助理       7-10k  \n386               NaN                   电商运营       8-11k  \n\n[76 rows x 11 columns]",
      "text/html": "<div>\n<style scoped>\n    .dataframe tbody tr th:only-of-type {\n        vertical-align: middle;\n    }\n\n    .dataframe tbody tr th {\n        vertical-align: top;\n    }\n\n    .dataframe thead th {\n        text-align: right;\n    }\n</style>\n<table border=\"1\" class=\"dataframe\">\n  <thead>\n    <tr style=\"text-align: right;\">\n      <th></th>\n      <th>Unnamed: 0</th>\n      <th>recruiter.recruiterTitle</th>\n      <th>comp.compScale</th>\n      <th>comp.compStage</th>\n      <th>comp.compIndustry</th>\n      <th>comp.compName</th>\n      <th>job.labels</th>\n      <th>job.dq</th>\n      <th>job.campusJobKind</th>\n      <th>job.title</th>\n      <th>job.salary</th>\n    </tr>\n  </thead>\n  <tbody>\n    <tr>\n      <th>0</th>\n      <td>0</td>\n      <td>人力</td>\n      <td>1-49人</td>\n      <td>NaN</td>\n      <td>非营利组织</td>\n      <td>中关村标准化协会</td>\n      <td>['IT/互联网/软件']</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>项目助理</td>\n      <td>5-10k</td>\n    </tr>\n    <tr>\n      <th>1</th>\n      <td>1</td>\n      <td>人力</td>\n      <td>1-49人</td>\n      <td>NaN</td>\n      <td>非营利组织</td>\n      <td>中关村标准化协会</td>\n      <td>[]</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>项目管培生</td>\n      <td>薪资面议</td>\n    </tr>\n    <tr>\n      <th>10</th>\n      <td>10</td>\n      <td>HRBP</td>\n      <td>100-499人</td>\n      <td>A轮</td>\n      <td>科技金融</td>\n      <td>一心向上</td>\n      <td>['数据运营', '产品运营', '工单管理', '互联网金融', '工具产品', 'to ...</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>产品运营经理——股权激励SaaS产品</td>\n      <td>8-10k·13薪</td>\n    </tr>\n    <tr>\n      <th>11</th>\n      <td>11</td>\n      <td>招聘经理</td>\n      <td>10000人以上</td>\n      <td>美股上市</td>\n      <td>互联网</td>\n      <td>Baidu</td>\n      <td>['产品运营', '社区运营', '策略运营', 'IT/互联网/软件']</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>AIGC产品运营(J59073)</td>\n      <td>25-50k·16薪</td>\n    </tr>\n    <tr>\n      <th>15</th>\n      <td>15</td>\n      <td>产品运营</td>\n      <td>10000人以上</td>\n      <td>美股上市</td>\n      <td>培训服务</td>\n      <td>北京世纪好未来教育科技有限公司</td>\n      <td>['产品运营', '数据分析']</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>产品运营实习生</td>\n      <td>3-5k</td>\n    </tr>\n    <tr>\n      <th>...</th>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n    </tr>\n    <tr>\n      <th>373</th>\n      <td>13</td>\n      <td>iOS开发</td>\n      <td>100-499人</td>\n      <td>NaN</td>\n      <td>科技推广服务</td>\n      <td>光谷动力科技</td>\n      <td>['HTML5']</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>HTML5</td>\n      <td>12-16k·13薪</td>\n    </tr>\n    <tr>\n      <th>374</th>\n      <td>14</td>\n      <td>人资专员</td>\n      <td>1-49人</td>\n      <td>NaN</td>\n      <td>计算机软件</td>\n      <td>北京企悦惠科技发展有限公司</td>\n      <td>['社群运营', '内容运营', '产品运营', '用户运营', '教育培训', '线上运营...</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>内容运营实习生（幼教）</td>\n      <td>2-5k</td>\n    </tr>\n    <tr>\n      <th>381</th>\n      <td>21</td>\n      <td>consultant</td>\n      <td>5000-10000人</td>\n      <td>美股上市</td>\n      <td>电子商务</td>\n      <td>去哪儿</td>\n      <td>['推荐产品', '策略产品', '智能推荐', '产品优化', '数据分析', '用户研究']</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>搜索推荐策略产品经理 (MJ005771)</td>\n      <td>25-40k·16薪</td>\n    </tr>\n    <tr>\n      <th>384</th>\n      <td>24</td>\n      <td>HRBP</td>\n      <td>100-499人</td>\n      <td>NaN</td>\n      <td>专业技术服务</td>\n      <td>都美(北京)品牌管理有限公司</td>\n      <td>['活动运营', '产品运营', '用户运营', '平台运营', '淘宝平台']</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>电商运营助理</td>\n      <td>7-10k</td>\n    </tr>\n    <tr>\n      <th>386</th>\n      <td>26</td>\n      <td>经理人</td>\n      <td>1-49人</td>\n      <td>融资未公开</td>\n      <td>批发/零售</td>\n      <td>北京祉君商贸有限公司</td>\n      <td>['电商类目运营', '母婴电商运营']</td>\n      <td>北京-海淀区</td>\n      <td>NaN</td>\n      <td>电商运营</td>\n      <td>8-11k</td>\n    </tr>\n  </tbody>\n</table>\n<p>76 rows × 11 columns</p>\n</div>"
     },
     "execution_count": 27,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "北京_海淀区 = df[df['job.dq'].isin(['北京-海淀区'])]\n",
    "北京_海淀区"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 29,
   "outputs": [
    {
     "data": {
      "text/plain": "{'咨询服务': ['BI工程师（14薪，全额社保）'],\n '非营利组织': ['项目助理', '项目管培生'],\n '新闻和出版业': ['项目助理（Scilit）', '项目助理（Scilit）', '项目助理（Scilit）'],\n '房地产租赁/中介': ['产品运营'],\n '通信设备': ['软件开发工程师', '大数据开发工程师'],\n '货运/物流/仓储': ['物流平台运营管理岗'],\n '培训服务': ['产品运营实习生', '产品运营', '美本留学产品专员', '课程销售'],\n '专业技术服务': ['海外运营经理', '新媒体运营', '电商运营助理'],\n '互联网': ['AIGC产品运营(J59073)',\n  '产品运营实习生',\n  '商业化产品运营-飞书People',\n  '产品运营实习生',\n  '产品运营',\n  '知道产品部_用户产品运营实习生(J66018)',\n  '物业市拓经理',\n  '海外运营总监',\n  '企业效能顾问（生态伙伴管理方向）-飞书',\n  '应用产品业务运营部_PMO(J54274)',\n  '资深SEO优化',\n  '飞书企业效能顾问-业务效能方向',\n  '零售行业解决方案实习生-火山引擎',\n  'HR数据分析实习生',\n  '内容运营实习生',\n  '能源互联网产品工程师',\n  '运营专员',\n  '菲律宾翻译',\n  '亚运会体育热点实习（外派百度）'],\n '航空/航天设备': ['产 品 经 理', '市场产品专员'],\n '科技推广服务': ['新媒体运营', 'HTML5'],\n '电子商务': ['搜索推荐策略产品经理 (MJ005771)'],\n '在线社交/媒体': ['交互设计师', '业务监察部-实习生', 'Golang后台开发工程师', '产品经理', '数据安全专家、资深工程师'],\n '其他教育培训': ['业务拓展专员/助理'],\n '在线教育': ['教学设计实习生 (MJ000027)'],\n '批发/零售': ['电商运营'],\n 'IT服务': ['体验提升产品经理'],\n '酒店/民宿': ['会员策略运营', '集团协议拓展'],\n '科技金融': ['产品运营经理——股权激励SaaS产品', '客户运营专员'],\n '环保': ['科考产品运营'],\n '计算机软件': ['产品运营实习生',\n  '产品运营实习生',\n  '国际化产品创作者运营实习生(巴西)',\n  '客户成功运营顾问',\n  '管理培训生（运营管理）',\n  '英语编辑',\n  '软件开发工程师',\n  '百度AI开放平台-智能创作-产品实习生',\n  '客户经理',\n  '内容运营实习生（幼教）'],\n '广播/影视/录音': ['产品运营实习生', '产品运营专员', '实习编辑', '用户运营'],\n '政府/公共事业': ['线上运营经理'],\n '人工智能': ['产品经理-视光 (MJ000558)'],\n '计算机硬件': ['工业互联网产业研究员'],\n '医疗器械': ['仪器产品经理'],\n '生活服务O2O': ['海外产品运营', '产品运营实习生'],\n '制药': ['数据分析专员']}"
     },
     "execution_count": 29,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "北京海淀行业_岗位 = {\n",
    "    i:北京_海淀区[北京_海淀区['comp.compIndustry'].isin([i])]['job.title'].values.tolist()\n",
    "    for i in 北京海淀区产业集合\n",
    "}\n",
    "北京海淀行业_岗位"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 21,
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "泰康健投\n",
      "北京人人平安科技有限公司\n",
      "苏州聊医聊信息科技有限公司\n",
      "景行慧动\n",
      "小川科技\n",
      "金溪县阿里兄弟电子商务有限公司\n",
      "睿艺视通信息技术(北京)有限公司\n",
      "爱康网\n",
      "酷渲(北京)科技有限公司\n",
      "北京百灵威科技有限公司\n",
      "我看网络技术(北京)有限公司\n",
      "北京天算资产管理有限公司\n",
      "北京瑞通领航科技有限公司\n",
      "深圳市商汤科技有限公司\n",
      "平安健康保险股份有限公司北京分公司\n",
      "北京双子博鑫文化传播有限公司\n",
      "一汽(北京)软件科技有限公司\n",
      "呷哺呷哺\n",
      "国科恒泰(北京)医疗科技股份有限公司\n",
      "北京君尚伟业科技有限公司\n",
      "麦凯隆(北京)家居用品有限公司\n",
      "北京市酥米教育科技有限公司\n",
      "北京简舍装饰设计有限公司\n",
      "布比科技\n",
      "北京蓝海在线科技有限公司\n",
      "北京中程润达科技有限公司\n",
      "北京网讯达科技有限公司\n",
      "远海国际旅游集团\n",
      "Baidu\n",
      "北京航天智造科技发展有限公司\n",
      "北京一来电子商务有限公司\n",
      "赋范空间\n",
      "北京疯狂体育产业管理有限公司\n",
      "完美世界\n",
      "京东方空间数智\n",
      "北京祉君商贸有限公司\n",
      "微博\n",
      "软通动力\n",
      "北京蓝色光标数字传媒科技有限公司\n",
      "沃丰科技\n",
      "北京东方明悦体育发展有限公司\n",
      "北京乐信圣文科技有限责任公司\n",
      "凤凰网\n",
      "北京金元尚杰科技有限公司\n",
      "宝马(中国)汽车贸易有限公司\n",
      "恒昌\n",
      "北京胜尊信息技术有限公司\n",
      "方正中期期货\n",
      "上海南燕信息技术有限公司\n",
      "京东商城\n",
      "北京天一沃德商务服务有限公司\n",
      "百度时代网络\n",
      "北京四维通联电讯器材有限公司\n",
      "云豆传媒(北京)有限公司\n",
      "骏安供应链科技有限公司\n",
      "半糖去冰科技(北京)有限公司\n",
      "北京金巴顺漾科技有限公司\n",
      "超极想网络科技(北京)有限公司\n",
      "北京朗迪锋科技有限公司\n",
      "愿景和家\n",
      "北京弘毅远科技有限公司\n",
      "北京掌上先机网络科技有限公司(慧策)\n",
      "北京中科九章软件有限公司\n",
      "北京京西重工有限公司\n",
      "北京章鱼小泡泡科技有限公司\n",
      "云南白药集团股份有限公司\n",
      "北京泽元堂\n",
      "须眉智能科技(江苏)有限公司\n",
      "高途\n",
      "联东集团\n",
      "北京金桐网科技有限公司\n",
      "迦游\n",
      "浙江游侠客国际旅行社有限公司北京分公司\n",
      "北京宠医点评科技有限公司\n",
      "北京乐城堡科技有限公司\n",
      "北京骏嘉财通科技有限公司\n",
      "中信期货\n",
      "戍源优品科技发展(北京)有限公司\n",
      "安徽省永幕教育咨询有限公司\n",
      "航天信息软件技术有限公司\n",
      "北京龙宏兴塑日用品有限公司\n",
      "北京顺丰同城科技有限公司\n",
      "北京睿美傲世文化传播有限公司\n",
      "中国人寿保险销售有限责任公司\n",
      "集易行\n",
      "百度网讯\n",
      "佛山市南海区中城数字城市促进中心\n",
      "北京炎龙时空通信科技有限责任公司\n",
      "烟台莹佳食品有限公司\n",
      "金诚信\n",
      "一寸光年\n",
      "快手\n",
      "北京医来伸手健康管理有限公司\n",
      "去哪儿\n",
      "镭神智能\n",
      "北京国质联合检测技术研究院\n",
      "华夏恒生\n",
      "网易有道\n",
      "北京信联数安科技有限公司\n",
      "深圳乐巢时代科技有限公司\n",
      "北京学策科技有限公司\n",
      "北京中欣银宝通支付服务有限公司\n",
      "北京链鲸科技有限公司\n",
      "北京城市网邻信息技术有限公司\n",
      "独角鲨(北京)科技有限公司\n",
      "北京清能互联科技有限公司\n",
      "润泽环保\n",
      "北京华清易点科技有限公司\n",
      "北京独角鲸群文化创意有限公司\n",
      "张家口花椒科技有限公司\n",
      "北京众心天诚科技发展有限公司\n",
      "朗姿股份有限公司\n",
      "北京和平阳光国际健身俱乐部有限公司\n",
      "北京金玺文化传媒有限公司\n",
      "北京开金睿远管理咨询有限公司\n",
      "北京汇智捷科技有限公司\n",
      "数坤科技\n",
      "北京京邦达贸易有限公司\n",
      "北京宏途创联科技有限公司\n",
      "北京世纪高教图书有限公司\n",
      "北京御生堂健康产业集团有限公司\n",
      "北京诚悦晟达商贸有限公司\n",
      "好大夫在线\n",
      "英雄互娱科技股份有限公司\n",
      "巴别时代\n",
      "北京海丰特环境科技发展有限公司\n",
      "北京同仁堂健康\n",
      "厦门安踏服饰有限公司\n",
      "中国青年出版总社有限公司\n",
      "北京云动九天科技有限公司\n",
      "北京法利莱移动板房有限公司\n",
      "北京厚朴优学教育科技有限公司\n",
      "北京青峰玉吉科技咨询服务有限公司\n",
      "中信科智联科技有限公司\n",
      "启鸣梧桐(北京)科技有限公司\n",
      "Yogo Robot\n",
      "北京易点淘网络技术有限公司\n",
      "守望地球(北京)环境科技有限公司\n",
      "新东方前途\n",
      "朗致集团\n",
      "新氧科技\n",
      "灵岩创世\n",
      "北京飞步凌云科技有限公司\n",
      "航天开元\n",
      "贝壳找房(北京)科技有限公司\n",
      "北京积木控文化有限公司\n",
      "北京鸿盈信息技术有限公司\n",
      "京华观致(北京)国际信息咨询有限公司\n",
      "北京形上科技有限责任公司\n",
      "云南澜博科技有限公司\n",
      "北京万相归春网络科技有限公司\n",
      "清源泰硕\n",
      "17173\n",
      "三星电子\n",
      "北京牛客科技有限公司\n",
      "天津魔芝工坊信息技术有限公司\n",
      "国信证券股份有限公司\n",
      "山东九鑫生物工程有限公司\n",
      "北京世纪好未来教育科技有限公司\n",
      "咏怀钟鼎\n",
      "德科信息\n",
      "中国农业电影电视中心\n",
      "北京红豆树网络科技有限公司\n",
      "北京一景园林有限公司\n",
      "时代传浮\n",
      "北京千里马网信科技有限公司\n",
      "北京合众衡平信息技术有限责任公司\n",
      "北京智慧星光信息技术有限公司\n",
      "HORWATH酒店管理顾问(北京)有限公司\n",
      "北京嘀果技术服务有限公司\n",
      "字节跳动\n",
      "北京华熙海御科技有限公司\n",
      "中讯邮电咨询设计院有限公司\n",
      "北京金风科创风电设备有限公司\n",
      "建信融通有限责任公司\n",
      "北京紫光数智科技股份有限公司\n",
      "北京新锐伟业网络技术有限公司\n",
      "视源股份\n",
      "阳光保险集团\n",
      "北京钓台傲骄食品科技有限公司\n",
      "北京锐服信科技有限公司\n",
      "走遍世界(北京)信息技术有限公司\n",
      "北京中航智科技有限公司\n",
      "永福盛(北京)食品有限公司\n",
      "是通科技(北京)有限公司\n",
      "北京华创盈讯科技有限公司\n",
      "中国民生银行股份有限公司\n",
      "北京博雅甲睿文化发展有限公司\n",
      "宜佰壹(北京)餐饮管理有限公司\n",
      "北京丰泽晟华农业科技发展有限公司\n",
      "单赤道(北京)咖啡餐饮管理有限责任公司\n",
      "华为\n",
      "北京优品酷卖科技有限公司\n",
      "蚂蚁集团\n",
      "北京课厅教育科技有限公司\n",
      "顺丰速运\n",
      "山东辰扬环境科技有限公司\n",
      "东风汽车金融有限公司\n",
      "北京学力星球科技有限责任公司\n",
      "中国电信股份有限公司\n",
      "修正药业集团股份有限公司\n",
      "北京易思卓科技有限公司\n",
      "思梵私募基金管理(杭州)有限公司\n",
      "北京乘风扬航科技有限公司\n",
      "明世公司\n",
      "北京微联至元商贸有限公司\n",
      "网易集团\n",
      "北京德达互动咨询有限公司\n",
      "北京润泽慧教育科技有限公司\n",
      "用友网络科技股份有限公司\n",
      "上海书品仓科技有限责任公司\n",
      "长信恒业家族办公室\n",
      "泰康健康管理(北京)有限公司\n",
      "水滴公司\n",
      "中国电信安全公司\n",
      "链家地产\n",
      "医药魔方\n",
      "颐康润养(北京)科技发展有限公司\n",
      "海南鹭鹰私募基金管理合伙企业(有限合伙)\n",
      "北京企悦惠科技发展有限公司\n",
      "施耐德电气\n",
      "中关村标准化协会\n",
      "北京鹰瞳科技发展股份有限公司\n",
      "北京崇珍科贸有限公司\n",
      "搜狐\n",
      "北京顺昌盛世医疗大数据科技有限公司同世堂第零零零中医诊所\n",
      "利玛软件\n",
      "北京聚英星辉科技有限公司\n",
      "美团网\n",
      "抖音视界有限公司\n",
      "华农财产保险\n",
      "泰康在线财产保险股份有限公司\n",
      "北京博思汇文数字科技有限公司\n",
      "华为云计算技术有限公司\n",
      "荣耀终端\n",
      "光谷动力科技\n",
      "海鸿达(北京)餐饮管理有限公司\n",
      "北京航天创智科技有限公司\n",
      "曼迪匹艾(北京)科技服务有限公司\n",
      "博思致新\n",
      "北京科学技术出版社\n",
      "百度(中国)有限公司\n",
      "京东集团\n",
      "上海尝享网络科技有限公司\n",
      "阿尔特汽车技术股份有限公司\n",
      "中国信息通信研究院\n",
      "北京知牧科技有限责任公司\n",
      "中国航空器拥有者及驾驶员协会\n",
      "北京质云数据科技有限公司\n",
      "金桐网\n",
      "百融云创\n",
      "北京人教希望读者服务有限责任公司\n",
      "畅游天下\n",
      "小米\n",
      "北京草莓时代文化传媒有限责任公司\n",
      "北京宏昆酒店集团\n",
      "梦灵国际医疗科技(北京)有限责任公司\n",
      "汇才远达(北京)科技有限公司\n",
      "北京玮航科技有限公司\n",
      "Transfer easy\n",
      "合生创展集团有限公司\n",
      "京东\n",
      "中科博爱(北京)咨询有限公司\n",
      "北京文迪威教育科技有限公司\n",
      "北京爱语吧科技有限公司\n",
      "北京格瑞广告传媒有限公司\n",
      "北京抖音信息服务有限公司\n",
      "蒙羊康盛(北京)食品有限公司\n",
      "北京书香文雅图书文化有限公司\n",
      "北京小牛邦信息技术有限公司\n",
      "中青旅控股股份有限公司\n",
      "花香盛世国际体育\n",
      "北京叁姐妹网络科技有限公司\n",
      "北京中润广益科技发展有限公司\n",
      "都美(北京)品牌管理有限公司\n",
      "美世留学\n",
      "一心向上\n",
      "北京北信源软件股份有限公司\n",
      "惠买在线\n",
      "北京创金启富\n",
      "三节课\n",
      "分享通信\n",
      "北京青翼凌云科技有限公司\n",
      "北京医来伸手健康管理有限公司同世堂中医诊所\n",
      "上海睿沃信息科技有限公司\n",
      "北京维应科技有限责任公司\n",
      "新世纪医疗\n",
      "北京网安通达科技有限公司\n",
      "金山办公软件\n",
      "欣可丽美学(上海)医疗科技有限公司\n",
      "北京牧游科技有限公司\n",
      "日推石化(北京)有限公司\n",
      "北京格力森酒业有限公司\n",
      "阿里巴巴集团\n",
      "北京爱车团网络科技有限公司\n",
      "北京伴刻翼科技有限公司\n"
     ]
    }
   ],
   "source": [
    "for j in set(df['comp.compName']):\n",
    "    print(j)"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 35,
   "outputs": [
    {
     "data": {
      "text/plain": "[{'name': '北京-海淀区',\n  'children': [{'name': '咨询服务', 'children': [{'name': 'BI工程师（14薪，全额社保）'}]},\n   {'name': '非营利组织', 'children': [{'name': '项目助理'}, {'name': '项目管培生'}]},\n   {'name': '新闻和出版业',\n    'children': [{'name': '项目助理（Scilit）'},\n     {'name': '项目助理（Scilit）'},\n     {'name': '项目助理（Scilit）'}]},\n   {'name': '房地产租赁/中介', 'children': [{'name': '产品运营'}]},\n   {'name': '通信设备', 'children': [{'name': '软件开发工程师'}, {'name': '大数据开发工程师'}]},\n   {'name': '货运/物流/仓储', 'children': [{'name': '物流平台运营管理岗'}]},\n   {'name': '培训服务',\n    'children': [{'name': '产品运营实习生'},\n     {'name': '产品运营'},\n     {'name': '美本留学产品专员'},\n     {'name': '课程销售'}]},\n   {'name': '专业技术服务',\n    'children': [{'name': '海外运营经理'}, {'name': '新媒体运营'}, {'name': '电商运营助理'}]},\n   {'name': '互联网',\n    'children': [{'name': 'AIGC产品运营(J59073)'},\n     {'name': '产品运营实习生'},\n     {'name': '商业化产品运营-飞书People'},\n     {'name': '产品运营实习生'},\n     {'name': '产品运营'},\n     {'name': '知道产品部_用户产品运营实习生(J66018)'},\n     {'name': '物业市拓经理'},\n     {'name': '海外运营总监'},\n     {'name': '企业效能顾问（生态伙伴管理方向）-飞书'},\n     {'name': '应用产品业务运营部_PMO(J54274)'},\n     {'name': '资深SEO优化'},\n     {'name': '飞书企业效能顾问-业务效能方向'},\n     {'name': '零售行业解决方案实习生-火山引擎'},\n     {'name': 'HR数据分析实习生'},\n     {'name': '内容运营实习生'},\n     {'name': '能源互联网产品工程师'},\n     {'name': '运营专员'},\n     {'name': '菲律宾翻译'},\n     {'name': '亚运会体育热点实习（外派百度）'}]},\n   {'name': '航空/航天设备', 'children': [{'name': '产 品 经 理'}, {'name': '市场产品专员'}]},\n   {'name': '科技推广服务', 'children': [{'name': '新媒体运营'}, {'name': 'HTML5'}]},\n   {'name': '电子商务', 'children': [{'name': '搜索推荐策略产品经理 (MJ005771)'}]},\n   {'name': '在线社交/媒体',\n    'children': [{'name': '交互设计师'},\n     {'name': '业务监察部-实习生'},\n     {'name': 'Golang后台开发工程师'},\n     {'name': '产品经理'},\n     {'name': '数据安全专家、资深工程师'}]},\n   {'name': '其他教育培训', 'children': [{'name': '业务拓展专员/助理'}]},\n   {'name': '在线教育', 'children': [{'name': '教学设计实习生 (MJ000027)'}]},\n   {'name': '批发/零售', 'children': [{'name': '电商运营'}]},\n   {'name': 'IT服务', 'children': [{'name': '体验提升产品经理'}]},\n   {'name': '酒店/民宿', 'children': [{'name': '会员策略运营'}, {'name': '集团协议拓展'}]},\n   {'name': '科技金融',\n    'children': [{'name': '产品运营经理——股权激励SaaS产品'}, {'name': '客户运营专员'}]},\n   {'name': '环保', 'children': [{'name': '科考产品运营'}]},\n   {'name': '计算机软件',\n    'children': [{'name': '产品运营实习生'},\n     {'name': '产品运营实习生'},\n     {'name': '国际化产品创作者运营实习生(巴西)'},\n     {'name': '客户成功运营顾问'},\n     {'name': '管理培训生（运营管理）'},\n     {'name': '英语编辑'},\n     {'name': '软件开发工程师'},\n     {'name': '百度AI开放平台-智能创作-产品实习生'},\n     {'name': '客户经理'},\n     {'name': '内容运营实习生（幼教）'}]},\n   {'name': '广播/影视/录音',\n    'children': [{'name': '产品运营实习生'},\n     {'name': '产品运营专员'},\n     {'name': '实习编辑'},\n     {'name': '用户运营'}]},\n   {'name': '政府/公共事业', 'children': [{'name': '线上运营经理'}]},\n   {'name': '人工智能', 'children': [{'name': '产品经理-视光 (MJ000558)'}]},\n   {'name': '计算机硬件', 'children': [{'name': '工业互联网产业研究员'}]},\n   {'name': '医疗器械', 'children': [{'name': '仪器产品经理'}]},\n   {'name': '生活服务O2O', 'children': [{'name': '海外产品运营'}, {'name': '产品运营实习生'}]},\n   {'name': '制药', 'children': [{'name': '数据分析专员'}]}]}]"
     },
     "execution_count": 35,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "data = [\n",
    "    {\n",
    "        \"name\":\"北京-海淀区\",\n",
    "        \"children\":[\n",
    "            {\n",
    "            'name':i,\n",
    "            'children':[\n",
    "                {'name':j} for j in 北京海淀行业_岗位[i]]\n",
    "            }\n",
    "            for i in set(df[df['job.dq'].isin(['北京-海淀区'])]['comp.compIndustry'])\n",
    "        ]\n",
    "    }\n",
    "]\n",
    "data"
   ],
   "metadata": {
    "collapsed": false
   }
  },
  {
   "cell_type": "code",
   "execution_count": 37,
   "outputs": [],
   "source": [
    "from pyecharts import options as opts\n",
    "from pyecharts.charts import Tree\n",
    "\n",
    "c = (\n",
    "    Tree()\n",
    "    .add(\"\", data, collapse_interval=2, layout=\"radial\")\n",
    "    .set_global_opts(title_opts=opts.TitleOpts(title=\"Tree-Layout\"))\n",
    "    .render(\"tree_layout.html\")\n",
    ")"
   ],
   "metadata": {
    "collapsed": false
   }
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3 (ipykernel)",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.10.9"
  },
  "toc": {
   "base_numbering": 1,
   "nav_menu": {},
   "number_sections": true,
   "sideBar": true,
   "skip_h1_title": false,
   "title_cell": "Table of Contents",
   "title_sidebar": "Contents",
   "toc_cell": false,
   "toc_position": {},
   "toc_section_display": true,
   "toc_window_display": false
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}
